通常工程師們在接到新任務的時候會由 PM (Product Manager) 產生 PRD。
今天,我們也要照這個流程,先來釐清「為什麼」要做這個專案,以及我們的目標。
痛點:
為什麼不用現成解法?
👉 因此我們想要做一個利用 語意檢索 (Semantic Search) + LLM回答的 企業知識庫 QA Chatbot,讓員工能直接用自然語言問問題。
🎯 成功標準:
一般員工:快速查詢流程、規範。
新人,要找「VPN 安裝方式」,不需要翻十幾份文件,直接問 Chatbot。
客服團隊:查詢常見問答,提升回覆效率。
客服人員,遇到客戶問「退款流程」,Chatbot 立刻給出答案和內部政策連結。
技術團隊:快速檢索技術文件、API 文件。
工程師,要確認「API v2 的驗證方式」,能快速檢索到最新文件。
測試環境:MacBook Air M3 (24GB RAM),僅供 PoC / Demo 效能參考,實際企業部署需依硬體與雲端環境調整。
uvicorn --reload
或 supervisor/launchd
自動重啟。💡 我們會在
Day27 - 實戰案例I- 公司內部 FAQ Chatbot
完成這個專案的實作以及驗收。
完整的 Demo 程式碼我會放在 GitHub Repo,有時候文章內只展示核心片段以避免篇幅過長。
上游的文件來源(例如 PDF、Slack 對話、API 回應)會先經過 Chunking 切片,把長文拆成較小段落,再轉換成 Embedding 向量。最後這些向量會被存進 向量資料庫(Vector DB,如 Weaviate / Pinecone / FAISS),成為知識庫的基礎。
使用者提出問題後,系統會先將 Query 轉成 Embedding,並在向量庫裡做 相似度檢索,找到最相關的段落。接著,將「使用者問題 + 檢索結果」組合成 Context + Query,送給 LLM API(例如 OpenAI)。模型生成答案後,會同時附上 來源引用,確保可解釋性。
把前兩個流程合併,就能看到完整的雛形系統:
如果把今天當成是 PM 的 Kickoff Meeting,那我們的 Roadmap 可以分成幾個階段:
基礎建設
從環境準備開始,挑選合適的資料庫與模型,跑起最小可行的 RAG Pipeline。
功能擴充
學會如何讓系統接更多資料來源、處理文件更新,並逐步提升檢索與回答的準確性。
架構與部署
進一步討論 API Gateway、Rate Limit、觀測性,讓這個系統能真的跑在企業內部。
實戰與進階
後面我們會做完整案例,並探索一些更前沿的改進方式。
今天,我們像 PM 一樣,把專案拆解成需求、目標、架構與風險。
我們確立了為什麼需要這個 Chatbot
、它要幫誰解決什麼問題,以及成功的衡量標準。
接下來的 28 天,會按照這份 roadmap
從基礎建設到實戰應用,一步步落地實作。
Day 3 我們會正式開始環境準備,打造一個能穩定開發、重現實驗的基礎環境。